AddN

对多个输入张量进行 逐元素相加,并将结果输出。 当前实现为二输入版本,可扩展用于多输入逐元素求和的场景。

数学表达式为:

\[dst_i = src0_i + src1_i\]
输入:
  • input0 - 第一个输入数据地址。

  • input1 - 第二个输入数据地址。

  • length - 计算长度(元素个数)。

  • core_mask - 核掩码(仅适用于共享存储版本)。

输出:
  • output - 计算结果地址。

支持平台:

FT78NE MT7004

备注

  • FT78NE 支持 fp32fp64int8int16int32cplx64cplx128 类型

  • MT7004 支持 fp16fp32int16int32cplx64 类型

  • 所有输入与输出张量需具有相同的长度与数据布局

共享存储版本:

void fp_addn_s(float *input0, float *input1, float *output, int length, int core_mask)
void dp_addn_s(double *input0, double *input1, double *output, int length, int core_mask)
void i8_addn_s(int8_t *input0, int8_t *input1, int8_t *output, int length, int core_mask)
void i16_addn_s(int16_t *input0, int16_t *input1, int16_t *output, int length, int core_mask)
void i32_addn_s(int32_t *input0, int32_t *input1, int32_t *output, int length, int core_mask)
void c64_addn_s(cplx64 *input0, cplx64 *input1, cplx64 *output, int length, int core_mask)
void c128_addn_s(cplx128 *input0, cplx128 *input1, cplx128 *output, int length, int core_mask)

C调用示例:

 1// FT78NE 示例
 2#include <stdio.h>
 3#include <addn.h>
 4
 5int main(int argc, char* argv[]) {
 6    float *input0 = (float *)0xA0000000;
 7    float *input1 = (float *)0xA0010000;
 8    float *output = (float *)0xC0000000;
 9
10    int length = 1024;
11    int core_mask = 0xff;
12
13    fp_addn_s(input0, input1, output, length, core_mask);
14    return 0;
15}

私有存储版本:

void fp_addn_p(float *input0, float *input1, float *output, int length)
void dp_addn_p(double *input0, double *input1, double *output, int length)
void i8_addn_p(int8_t *input0, int8_t *input1, int8_t *output, int length)
void i16_addn_p(int16_t *input0, int16_t *input1, int16_t *output, int length)
void i32_addn_p(int32_t *input0, int32_t *input1, int32_t *output, int length)
void c64_addn_p(cplx64 *input0, cplx64 *input1, cplx64 *output, int length)
void c128_addn_p(cplx128 *input0, cplx128 *input1, cplx128 *output, int length)

C调用示例:

 1// FT78NE 示例
 2#include <stdio.h>
 3#include <addn.h>
 4
 5int main(int argc, char* argv[]) {
 6    float *input0 = (float *)0x10810000;   // L2 空间
 7    float *input1 = (float *)0x10814000;
 8    float *output = (float *)0x10820000;
 9
10    int length = 1024;
11
12    fp_addn_p(input0, input1, output, length);
13    return 0;
14}